Este módulo introductorio cierra la brecha entre los arreglos de caracteres brutos y sin estructura y el rigor matemático de teoría de lenguajes formales. Pasamos de búsqueda imperativa—inspección manual carácter por carácter—hacia especificación declarativa, donde definimos una gramática formal que representa el conjunto infinito de cadenas válidas.
1. La Naturaleza de la Entropía de Cadenas
Los datos crudos son intrínsecamente "desordenados" porque carecen de estructura; simplemente son una secuencia de bytes hasta que una gramática formal clasifica sus componentes. En el diseño de protocolos, validar esta entropía es la primera línea de defensa contra entradas malformadas.
2. Paradigmas y Autómatas
Las expresiones regulares se basan en la Jerarquía de Chomsky. Las expresiones regulares sirven como planos para construir Autómatas Finitos Deterministas (AFD). En lugar de escribir si-sino de cadenas para encontrar patrones, definimos qué es el patrón es, permitiendo que el motor maneje la lógica de recorrido.